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Beschreibung 



Verfahren zur Erstellung von fur Datensatze aus einer Datenbank, insbeson- 
dere aus dem World-Wide-Web, charakteristischen Kurzdatensatzen, Verfah- 
ren zur Ermittlung von fur eine vorgebbare Suchanfrage relevanten Daten- 
satzen aus einer Datenbank und Suchsystem zur DurchfUhruhg des Verfah- 



rens 



Die Erfindung bezieht sich auf ein Verfahren zur Erstellung von fur Datensatze 
aus einer Datenbank, insbesondere aus dem World-Wide-Web, charakteristi- 
schen Kurzdatensatzen zur Hinterlegung auf einem Speichermodul als Basis zur 
Ermittlung der fur eine vorgebbare Suchanfrage relevanten Datensatze. Sie betrifft 
weiter ein Verfahren zur Ermittlung von fur eine vorgebbare Suchanfrage relevan- 
ten Datensatzen aus einer Datenbank, insbesondere aus dem World-Wide-Web, 
bei dem derartige Kurzdatensatze auf ihre Relevanz fQr die jeweilige Suchanfrage 
hin durchsucht werden. Weiterhin betrifft die Erfindung ein Suchsystem zur Ermitt- 
lung von fQr eine vorgebbare Suchanfrage relevanten Datensatzen aus einer Da- 
tenbank, insbesondere aus dem World-Wide-Web. 

In komplexen Datenbanken Oder auch im weltumspannenden Computernetz 
CWorld-Wide-Web") wird eine enorme Menge an Informationen bereitgehalten, 
die ein Benutzerzu Recherchezwecken mehr Oder weniger gezielt abrufen kann. 
Urn dabei Informationen aus der groften Informationsmenge heraus gezielt nutz- 
bar machen zu konnen, kommen so genannte Suchmaschinen zum Einsatz, die 
gerade bei der Informationsbeschaffung aus dem World-Wide-Web teilweise er- 
hebliche Verbreitung erfahren haben. Bei derartigen Suchmaschinen wird dem 
Benutzer Qblicherweise Qber ein Ein-/Ausgabemodul ein Anfragenfenster zur Ver- 
fUgung gestellt, uber das gezielte Such- oder Recherchebegriffe vorgegeben wer- 
den konnen. Anschliellend durchsucht die Suchmaschine die Informationsbasis 
der Datenbank bzw. des World-Wide-Web nach geeigneten SchlQssel- oder Key- 
wortern. Die daraufhin aufgefundenen Antwortdatensatze werden Qblicherweise 
von der jeweiligen Suchmaschine hinsichtlich ihrer Relevanz fQr den vorgegebe- 
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nen Suchauftrag kategorisiert und dem Benutzer in der Art einer Trefferliste in 
nach ihrer Relevanz geordneter Reihenfolge zur Verfugung gestellt. 

Allerdings bereitet die zunehmende Komplexitat der eingesetzten Datenbanken 
und .nsbesondere der stetig wachsende enorme Informationsgehalt im World- 
Wide-Web zunehmende Probleme bei der strukturierten und gezielten Beschaf- 
fung von Informationen. Die fur die Recherche eingesetzten Suchmaschinen wer- 
den daher zunehmend bezOglich der eingesetzten Suchalgorithmen verbessert 
wobei zudem in der Art von Vorsortierungen oder Vorfilterungen weitere Hilfsmittel 
zur Klassifizierung von Datensatzen aus der Datenbank zum Einsatz kommen " 
konnen. Insbesondere im World-Wide-Web sind die Datensatze ublicherweise in 
Form von so genannten Domains strukturiert und organisiert, wobei eine Domain 
typischerweise von einem Betreiber unterhalten wird und ihrerseits eine Vielzahl 
von Unterdatensatzen, Textdokumenten oder dergleichen umfassen kann. 

Urn gerade bei der Informationsbeschaffung aus dem World-Wide-Web trotz der 
eriormen Vielzahl der dort verfQgbaren Datensatze oder Domains mtt einem sei- 
nerseits moglicherweise vergleichsweise grolien Inhalt an Unterdatensatzen oder 

eine geeignete Vorauswahl von bei einer vorgegebenen 
Suchanfrage zu berticksichtigenden Domains treffen zu kBnnen. kann ein so ge- 
nanntes Ranking der Domains zum Einsatz kommen. Dabei wird jeder Domain ein 
Kennwert zugeordnet, der anhand vonzuganglichen Sekundarinformationen in 
der Art einer relativen Relevanz die Wichtigkeit der Berucksichtigung der jeweili- 
gen Domain fur die Suchanfrage charakterisiert. Bei der Zuordnung dieses Kenn- 
werts zur jeweiligen Domain wird Qblicherweise in der Art eines so genannten sta- 
fschen Ansatzes eine Informationsbasis herangezogen, bei der beispielsweise 
aufgrund des Grades der Vernetzung der jeweiligen Domain mit anderen Domains 
auf die relative Bedeutung der jeweiligen Domain geschlossen wird. Als Mali fur 
eine derartige Bedeutung kann die Anzahl der so genannten Links oder Querver- 
weise von anderen Domains auf die jeweilige Domain herangezogen werden wo- 
be, die Annahme zugrunde gelegt wird, dass eine Vielzahl von Querverweisen auf 
die jeweilige Domain ein Hinweis darauf 1st, dass diese Domain fur eine Vielzahl 
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Allerdings hat sich gezeigt, dass bei der Zuordnung einer derartigen statisohen . 
Kenngreae als Relevanzindikator fur die jeweilige Domain Spielraum fur Manipula- 
tonen besteht, wobei unabhanglg von den eigentliohen Benutzerintere S sen auf- 
grund wirtschaftlicher Entscheidungen durch die Herstellung einer Vielzahl sach- 
Hch eigentlioh nicht gerechtfertigter Links Oder Querverweise kunstlich der Ein- 
druck einer vergleichsweise hohen Rslevanz Oder Bedeutsamkeit der jeweiligen 
Doma,n erzeugt warden kann. Die Verwendung derartiger statisoher Ralevanzzu- 
ordnungen 2 ur Verbesserung der Suchengebnisse von Internet-Reoherchen ist da- 
her von eher abnehmendem Interesse. 

Die enormen. im World-Wide-Web Oder Internet verfflgbaren Infom^tionsmengen 
machen bei der Durchffihnmg einer Informationsrecherche die tatsachlicha Duroh- 
suchung samtlioher Domains inklusive derdarln enthaltenen Untendatensatee 
oderTextbausteine in Eohtzeit auf das Vorhandensein der Suchanfrage Oder von 
amzelnen Elementen der jeweiligen Suchanfrage unmfiglich. Statt dessen kom- 
men ,n Suohsystemen Oder Suchmaschinen «r dia Informationsbeschaffung aus 
dam Internet Oder Wond-Wide-Web so genannte .Crawler" oder Durohsuchermo- 
dule zum Einsatz, dia standig die Domains oder Datensatee aus dam World-Wide- 
Web bzw. einer komplexen Datenbank auf ihren Textinhalt Oder andera als rele- 
vant erachtete Infomationen hin durchsuohan. Im Rahman von vorgegebenan 
Systemressourcen (beispielsweise Bearbeitungszeit, Speicherkapazitat oder Re- 
ohanlalstung) durchsuoht das jaweiliga Durohsuchermodul dia gerade angewahlte 
Domain oder dan Datensatz und stellt bis zu einer duroh dia zugawiesenen Sys- 
temressoureen vorgegebenen Grenze anhand dar In der jeweiligen Domain aufge- 
fundanen Informationen einan fDr die Domain odar dan Datansatz charakteristi- 
sohen Kurzdatensatz, baispieisweise in Form einar Textdatei mtt meglicherweise 
zugeordneten Uberschriften oder sonstigen Indikatoren, zusammen 
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DieserKurzdatensatzwird sodann auf einem Speichermodul hinteriegt und fOr ei- 
ne nachfolgende Untersuchung bereitgehatten. Die Gesamtheit der aus den Ober- 
haupt bei diesem Vorgehen berOcksichtigten Datensatze Oder Domains erstellten 
auf dam Speichermodul hinteriegten Kurzdatensatze wird auoh als so genannter 
.Index" der jeweiligen Suchmaschine bezeichnet und dient als Informationsbasis 
ftir d,e nachfolgend durchgefOhrten Reoherchen. Die Erstellung der im Index ent- 
haltenen Kurzdatensatze erfolgt dabei Obllcherweise kontinuieriich, wobei individu- 
als Domains zyklisch angewahlt warden, so dass aine andauernde Aktuaiisierung 
des Indax erfolgt. Bei ainer naohfblgenden Recherche, also bei der Ermittlung der 
ft" a,ne vorgegebena Suohanfrage relevanten Datensatze, wird sodann derdurch 
d,e Gesamthelt der hinteriegten Kurzdatensatze gebildeta Index auf das Vorhan- 
densein von SchlOssel- Oder Keywbrtem der jeweiligan Suohanfrage odar von Ein- 
zalelementen davon durchsucht, wobei anhand der dabei erzialtan Suchergebnis- 
se Oder Treffer die den aufgefundanan Kurzdatensatzen zugaordnaten Datensat- 
ze Oder Domains als relevant for die jeweilige Suchanfrage ermittelt warden. 

Autgmnd der Vielzahl der im World-Wide-Web verfQgbaren Domains Oder Daten- 
satze konnen nicht samtliche Domains bei der Erstellung der Kurzdatensatze be- 
rucksichtigt warden. Die Entscheidung. welche Domains bei dar Erstellung des In- 
dax berocksichtigt warden, erfolgt dabei Obllcherweise anhand der oben genann- 
ten Relevanzkriterten, also insbesondera anhand von Informationen Obereine ar- 
kannte oder vermeintliche Bedeutung dar Jeweiligen Domain for die Banutzer Ge- 
rade da rnfolge der verfOgbaran Informationsvielfalt eine besonders zialgeriohtete 
Vorsortierung der Informationen und insbesondere der als for eine Suchanfrage 
relevant erkannten Datensatze fOr die nachfolgende Auswertung dar Recherche- 
ergebnissa sehr bedeutsam sein kann, 1st bereits bai der Erstellung des so ge- 
nannten Index eine besonders hoha Qualitat und Sorgfalt be! der Auswertung der 
berOcksichtlgten Informationen wllnschenswert. 

Der Erflndung liegt daher die Aufgabe zugrunde, ain Verfahran zur Erstellung von 
for Datensatze charakteristiachen Kurzdatensatzen der oben genannten Art anzu- 
geben. mrt dam eln fOr eine qualitativ hochwertige Informationsbaschaffung aus 
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nen und somit die Vollstandigkeit der im Kurzdatensatz fur die Informationsbe- 
schaffung bereitgehaltenen Informationen entscheidend mitbestimmen, im Hin- 
blick auf das Benutzerinteresse unter Berucksichtigung von Erfahrungswerten aus 
vorangegangenen Suchanfragen zugewiesen. 

In besonders einfacher und prSgnanter Weise konnen die Benutzerinteressen be- 
reits bei der Ersteliung des Index berucksichtigt werden, indem vorteilhafterweise 
bei der Zuordnung der Systemressourcen die Haufigkeit yon zu einer Suchanfrage 
gleichen oder ahnlichen Suchanfragen in der jQngsten Vergangenheit als Erfah- 
rungswert berucksichtigt wird. In weiterer vorteilhafter Ausgestaltung kann .dabei 
auch die Trefferhaufigkeit der Datensatze oder Domains bzgl. der von den Benut- 
zern in jungster Vergangenheit besonders haufig vorgegebenen Suchanfragen be- 
rucksichtigt werden. Die Erfahrungswerte umfassen daher zweckmaftigerweise ei- 
ne fur die Anzahl gleichartiger Suchanfragen in einem vorgebbaren Zeitintervall 
charakteristische Kennzahl. 

Urn die Benutzerinteressen besonders zielfuhrend bereits bei der Ersteliung des 
Index fur die Suchmaschine berQcksichtigen zu kSnnen, werden vorteilhafterweise 
als Systemressourcen die Ressourcen eines zur Ersteliung der fur die Datensatze 
jeweils charakteristischen Kurzdatensatze vorgesehenen Durchsuchermoduls 
oder Crawlers unter BerQcksichtigung von ermittelten Erfahrungswerten aus vor- 
angegangenen Suchanfragen gewahlt. 

In einer besonders vorteilhaften Ausgestaltung werden die Benutzerinteressen bei 
der Zuordnung der Systemressourcen besonders weitgehend berucksichtigt, in- 
dem bei der Ermittlung der Erfahrungswerte in besonderem Mali die moglicher- 
weise komplexe Struktur der von den Benutzern verwendeten Suchanfragen be- 
rticksichtigt wird. Dabei liegt die Erkenntnis zugrunde, dass ein besonders genau- 
es Abbild des allgemeinen Benutzerinteresses nicht allein durch die relative Hau- 
figkeit einzelner in Suchanfragen verwendeter Elemente oder Begriffe, sondern er- 
ganzend oder zusatzlich auch noch durch die BerOcksichtigung von spezifischen 
Korrelationen zwischen einzelnen Begriffen oder Elementen von Suchanfragen er- 
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■ z,elt warden kann. Dabei wird insbesondere berticksichtigt, dass einzelne Elemen 
> to Oder Komponenten einer Suchanfrage entsprechend dem aktuell gerade ver- 
. brerteten Benutzerinteresse bevo-zug. in Kombination mft spezifischen anderen 
. Emzetelementen Oder Komponenten von Suohanfragen angefragt werden. Bei- 
sp^weise kbnnte das aktuelle Benutzerinteresse im Allgemeinen aktuel, in eine 
R,chtung gehen, dass bevorzugt kostenlose Multimedia-Dateien aus dem Internet 
heruntergeladen werden sollen. In einer derartigen Konstellation 1st bei Suchanfra 
gen vermehrt mil einer Kombination der Suchbegriffe .MP3", ..free" und .down- 
load" zu rechnen. Bei der spezifisohen Bewertung und BerQcksiohtigung vergan- 
gener Suohanfragen kann somit die Kombination dieser drei Einzelelemente einer 
Suchanfrage als ein besonders gewichtiger Indikator far gesteigertes Benutzerin- 
teresse gewertet werden. Urn dies zu ermSglichen. werae'n bei der Ermittiung der 
Erfahrungswerte vorcugsweise Korrelationen zwisohen Einzelelementen der Such- 
anfragen berucksichtigt. 

Urn in der Art einer eraten Vorfiltenmg eine veraleichsweise einfach beschafmare 
E.ngangsinformation for die Bewertung von Suohanfragen und ihrer Relevanz fur 
d,e Datensaze bereitzustellen, wird bei der Ermittiung der Erfahrungswerte vorteil- 
hafteme.se die relative Haufigkeit von Suohanfragen und/oder von Einzelelemen- 
ten der Suohanfragen berQcksichfigt. Dies kann auf besonders einfache Weise 
unmitteibar bei der Ersteiiung des index berDoksichtigt werden, indem denjenigen 
Datensatzen, die for eine vorgegebene Suchanfrage oder fur eine vorgegebene 
Komt,, n a«on aus Einzelelementen von Suohanfragen als relevant erkannt women, 
vorterlhaftenveise in Abhangigkeit von der relativen Haufigkeit der Suchanfrage 
bzw. der Kombination aus Einzelelementen von Suohanfragen zusatzliche Sys- 
temressourcen fur die Erateilung des zugeomneten Ku^datensatzes zugewiesen 
werden. 

Vorteilhafterweise werden die auf die genannte Art erstellten. fur die DatensStze 
Z 1 CharakteriS,iSchen Xu-datensatee zur Ermittiung von for eine 

vorgebbare Suchanfrage relevant ba.ensa.zen aus der Datenbank. insbeson- . 
dere aus dem World-Wide-Web, genutzt, indem die solchermaRen erstellten in 
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einem Speichermodul hinterlegten Kurzdatensatze auf ihre Relevanz fQr die jewei- 
lige Suchanfrage hin durchsucht werden. Als Kriterium fur die Ermittlung dieser 
Relevanz kann dabei beispielsweise die Haufigkeit dienen, mit der ein Schlussel- 
oder Keywort der Suchanfrage im jeweiligen Kurzdatensatz aufgefunden werden 
kann, wobei zudem noch eine Differenzierung nach dem Ort des jeweiligen Auffin- 
dens, beispielsweise in einer Oberschrift oder im Volltext, vorgenommen werden 
kann. 



BezQglich des Suchsystems zur Ermittlung von fQr eine vorgebbare Suchanfrage 
reievanten Datensatzen aus einer Datenbank, insbesondere aus dem World- 
Wide-Web, wird die genannte Aufgabe gelost, indem in einem Speichermodul fQr 
die Datensatze charakteristische Kurzdatensatze hinterlegt sind, wobei die zur Er- 
stellung eines Kurzdatensatzes aus einem Datensatz bereitgestellten Systemres- 
sourcen unter BerQcksichtigung von hinterlegten Erfahrungswerten aus vorange- 
gangenen Suchanfragen gewahlt sind. 

Die Erfahrungswerte umfassen dabei vorteilhafterweise eine fQr die Anzahl gleich- 
artiger Suchanfragen in einem vorgebbaren Zeitintervall charakteristische Kenn- 
zahl. In zusatzlicher oder alternativer vorteilhafter Ausgestaltung sind als System- 
ressourcen die Ressourcen eines zur Erstellung der fQr die Datensatze Jewells 
charakteristischen Kurzdatensatze vorgesehenen Durchsuchermoduls unter Be- 
rQcksichtigung von hinterlegten Erfahrungswerten aus vorangegangenen Suchan- 
fragen gewahlt. 

Die mit der Erfindung erzielten Vorteile bestehen insbesonderedarin, dass durch 
die BerQcksichtigung von Erfahrungswerten aus vorangegangenen Suchanfragen 
bei der Vergabe der Systemressourcen bei der Erstellung des Index oder der fur 
die Datensatze charakteristischen Kurzdatensatze bereits in einem besonders fru- 
hen Stadium, namlich in der Vorbereitungsphase einer Datenbank- oder Internet- 
Recherche, eine weit gehende BerQcksichtigung des aktuell vorhandenen Benut- 
zerinteresses erm6glicht ist. Gerade durch die BerQcksichtigung des Benutzerin- 
teresses erganzend zu oder anstelle von bisher verwendeten Datenbank spezifi- . 
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schen Charakteristika wie beispielsweise der Haufigkeit der jeweiligen Querver- 
weise ist eine vom Benutzer als besonders hochwertig angesehene Informations- 
beschaffung ermbglicht. Ein besonders spezifisches Abbild des Benutzerinteres- 
ses und somit eine besonders hohe Genauigkeit bei der Vergabe der Ressourcen 
ist dabei erreichbardurch die BerGcksichtigung von Korrelationen zwischen einzel- 
nen Elementen von Suchanfragen, wobei gerade besonders haufig verwendete 
Kombinationen spezifischer Einzelelemente und der RGckschluss auf die mit der- 
artigen kombinierten Suchanfragen als Ergebnis aufgefundenen Datensatze oder 
Domains eine in besonderem Mafte an das Benutzerinteresse angepasste Tref- 
fergenerierung erwarten lasst. 



Ein Ausfuhrungsbeispiel der Erfindung wird anhand einer Zeichnung naher erlau- 
tert. Darin zeigt die Figur schematise ein Suchsystem zur Ermittlung von fur eine 
vorgebbare Suchanfrage relevanten Datensatzen oder Domains aus dem World- 
Wide-Web. 

Das Suchsystem 1 gemall der Figur ist uber die mittels der Doppelpfeile 2 ange- 
deuteten Datenleitungen des Internets oder World-Wide-Web mit einer Vielzahl 
von Domains 4 verbunden, wobei jede Domain 4 ihrerseits typischerweise eine 
Vielzahl von Unterdatensatzen, Textbausteinen, multimedialen Informationsele- 
menten oder dergleichen umfasst. 

Aufgrund der groUen Vielzahl an im World-Wide-Web verfugbaren Informationen 
ist das Suchsystem 1 fur die Bearbeitung einer Suchanfrage nicht fur die Durch- 
suchung der Domains 4 oder der in ihnen enthaltenen Informationsinhalte auf das 
Vorhandensein bestimmter Schlusselwdrter oder Keyw6rter, sondern statt dessen 
fur die Durchsuchung eines in einem Speichermodul 6 hinterlegten so genannten 
Index 8 ausgelegt. Der Index 8 umfasst eine Vielzahl von Kurzdatensatzen 1 0, 
von denen jeder jeweils fur einen Datensatz oder eine Domain 4 des World-Wide- 
Web charakteristisch ist. Jeder Kurzdatensatz 10 enthalt dabei einen als relevant 
erkannten Teil des Informationsgehalts der jeweils zugeordneten Domain 4, wobei 
im Kurzdatensatz 10 insbesondere die in der jeweiligen Domain 4 enthaltene 
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Textinformation wiedergegeben ist. Zur Bearbeitung einer Suchanfrage wird die- 
se, wie durch den Pfeil 12 angedeutet, einem EinVAusgabemodul 14 des Subsy- 
stems 1 zugefuhrt, von wo aus anhand von fur die Suchanfrage charakteristischen 
Schlussel- Oder Keywortem eine Durchsuchung der Kurzdatensatze 10 gestartet 
wird. Abhangig von der Anzahl der Ergebnisse oder Treffer, mit denen das Vor- 
handensein von Schlussel- oder KeywSrtern in den Kurzdatensatzen 10 festge- 
stellt wird, wird die mit dem jeweiligen Kurzdatensatz 10 korrespondierende Do- 
main 4 als fur die Suchanfrage relevant erkannt und die entsprechende Domain- 
adresse dem Benutzer auf einer Ergebnisliste mitgeteilt. 

Zur Erstellung der fur die Domains 4 charakteristischen Kurzdatensatze 10, die in 
ihrer Gesamtheit den Index 8 bilden, umfasst das Suchsystem 1 ein auch als 
..Crawler" bezeichnetes Durchsuchermodul 16. Das Durchsuchermodul 16 nimmt 
in regelmaliigen, vorzugsweise zyklischen Zeitintervallen Kontakt mit den jeweili- 
gen Domains 4 auf und durchsucht diese hinsichtlich ihres Informationsgehalts. 
Dabei kann insbesondere vorgesehen sein, die auf der jeweiligen Domain 4 hin- 
terlegte Textinformation zu erfassen und geeignet zu komprimieren. Art und Urn- 
fang der Analyse des Inhalts jeder Domain 4 durch das Durchsuchermodul 16 
werden dabei durch die Vorgabe spezifischer Systemressourcen des Durchsu- 
chermoduls 16 fur die jeweilige Domain 4 festgelegt. Als Systemressourcen kon- 
nen dabei abhangig von der jeweiligen Domain 4 beispielsweise die fGr die Durch- 
suchung vorgesehene Zeitspanne, die eingesetzte Rechnerleistung und/oder zu- 
gewiesene Speicherkapazitaten vorgegeben sein. Dabei kann insbesondere auch 
vorgegeben sein, ob die jeweilige Domain 4 vom Durchsuchermodul 16 uberhaupt 
angesprochen oder von vomherein ignoriert werden soli. Anhand der bei der 
Durchsuchung ermittelten Informationsbasis fur die jeweilige Domain 4 wird an- 
schlieftend vom Durchsuchermodul 16 in der Art einer Kurzfassung derzugeord- 
nete Kurzdatensatz 10 erstellt und als Bestandteil des Index 8 im Speichermodul 
6 abgelegt. 

Die Zuordnung der Systemressourcen fur die Durchsuchung der jeweiligen Do- 
main .4 kann beispielsweise in Abhangigkeit domainspezifischer Relevanzkenn- 
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werte erfolgen. Dabei k6nnen auch so genannte statische Relevanzkennwerte 
vorgesehen sein, die anhand vorgegebener Kriterien wie beispielsweise dem Ver- 
netzongsgrad einer Domain 4 mil anderen Domains 4 charakterisieren, wie hooh 
der Akzeptanzgrad derjeweiligen Domain 4 bei den Bengtzern ist . Anhand dieser 
Relevanzkennwerte kann festgeleg, sein, ob eine Domain 4 bei der Durchsuohung 
uberhaupt berGcksichtigt wird, und falls ja, wie sorgfalBg die Durchsuohung derje- 
weiligen Domain 4 bei der Erstellung des zugeordneten Kurzdatensatzes 10 erfol- 
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DarGber hinaus ist das Suohsystem 1 aber auch dafflrausgelegt, bei der Erstel- 
lung der Kurzdatensfibe 10 Erfahmngswerte und Erkenntnisse aus den vorange- 
gangenen Suchanfragen mit zu berOcksichtlgen und somit das darin wiedertjege- 
bene aktuelle Benutzerinteresse in besonderem MaBe in die Eratellung Oder zykli- 
sche Emeuerung des Index 8 miteinflieBen zu lassen. Dazu ist dem Speichermo- 
dul 6 ein weiteres Speichermodul 18 zugeordnet, in dem in der Art eines Log- 
buchs die eingehenden Suchanfragen zurweiteren Auswertung abgelegt warden. 
D,e Inhalte des Speichermoduls 18 wenden einem Analysemodul 20 zuganglich 
gemacht, das die eingegangen Suchanfragen einer Auswertung untenant und 
anhand der dabei gewonnenen Erkenntnisse eine Neuverteilung der Systemres- 
souroen auf die zu berticksichtigenden Domains 4 beim nachstan Durchsuchungs- 
zyklus vornimmt. Die entsprachende Zuomnung der Systemressouroen Obermittelt 
das Analysemodul 20, wie Ober den Pfeil 22 dargestellt, anschlieSend an das 
Durchsuchermodul 16. 

Bei der Zuordnung der Systemressouroen bertlcksichtigt das Analysemodul 20 so- 
m,t Erfahmngswerte aus vorangegangenen Suchanfragen. Dies kann beispiels- 
weise dadurch geschehen, dass die Hauflgkeit ainer Suchanfrage Oder eines 
Schlussel- Oder Keyworts als Einzelelement einer Suchanfrage ermittelt wird, wo- 
be, bei haufig verwendeten Suchanfragen Oder Einzalelementen von Suchanfra- 
gen auf eine deceit vergleichsweise hohe Popularity bei den Benutzem ge- 
schlossen wird. Dementsprechend wlra angenommen, dass die bei ve^leichswei- 
ee popularen Suchanfragen aufgefundenen und als relevant erkannten Datensat- 
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ze Oder Domains 4 in vergleichsweise hohem MaRe das aktuelle Benutzerinteres- 
se widerspiegeln. In dieser Ausfuhrungsform kann das Analysemodui 20 somit 
denjenigen Domains 4, die als Ergebhis far vergleichsweise ha.ufig verwendete 
Suchanfragen aufgefQhrt werden, einen entsprechend erhohten Anteil an System- 
ressourcen bei der nachstfolgenden Durchsuchung durch das Durchsuchermodul 
1 6 zuordnen. 

DarOber hinaus ist das Suchsystem 1 aber auch dafttr ausgelegt, vergleichsweise 
komplexe Strukturen im Profil der Suchanfragen bei der Zuordnung der System- 
ressourcen durch das Analysemodui 20 mitzuberiicksichtigen. Dabei werden bei 
der Ermittlung der Erfahrungswerte insbesondere auch Korrelationen zwischen 
Einzelelementen von Suchanfragen mitberGcksichtigt. Falls beispielsweise festge- 
stellt wird, dass einzelne Elemente oder SuchwSrter in Suchanfragen besonders 
haufig mit bestimmten anderen Einzelelementen oder SuchwOrtern kombiniert 
werden, so wird auf eine hohe intrinsische Korrelation zwischen diesen beiden 
Suchelementen geschlossen, so dass einerseits diejenigen Domains 4, in denen 
vollstandige oder approximative Kombinationen aufgefunden werden, als 
besonders relevant erkannt werden, wobei andererseits bei der Auswertung der 
relativen Haufigkeiten einzelner Suchelemente auch die relativen Haufigkeiten der 
damit besonders korrelierten weiteren Suchelemente berucksichtigt werden 
konnen. 

Zur statistischen Auswertung der Suchanfragen wird dabei im Analysemodui 20 
eine Korrelationsmatrix erstellt, deren Matrlxelemente ein quantitatives MafS fur die 
Korrelation zwischen jeweils zwei Einzelelementen von Suchanfragen angeben. 
Als quantitatives MaR kann dabei insbesondere die relative Haufigkeit, mit der die 
beiden jeweiligen Einzelelemente von Suchanfragen miteinander in Kombination 
gefragt werden, vorgesehen sein. Diese Korrelationsmatrix wird anschlieftend 
durch eine Hauptachsentransformation diagonalisiert, wobei auf der Hauptdiago- 
nalen der diagonal isierten Matrix die Eigenwerte der ursprunglichen Korrelations- 
matrix angegeben sind. Bei dieser Hauptachsentransformation werden zudem die 
Eigenvektoren der Korrelationsmatrix ermittelt. 
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Die Eigenwerte und Eigenvektoren der Korrelationsmatrix kdnnen anschliefcend 
fur eine weitere Auswertung der Suchanfragen herangezogen werden. Diejenigen 
Eigenvektoren der Korrelationsmatrix, die einen vergleichsweise grolien Eigenwert 
aufweisen, entsprechen dabei einem Mix von Einzelelementen von Suchanfragen, 
der gemad der Linearkoeffizienten der Einzelelemente der Suchanfragen ver- 
gleichsweise haufig in typischen Suchanfragen vorkommt und somit in besonde- 
rem MalJe das aktuelle Benutzerinteresse widerspiegelt. Es werden somit in ei- 
nem nachsten Schritt diejenigen Eigenvektoren der Korrelationsmatrix ausge- 
wahlt, denen ein vergleichsweise grolier Eigenwert zugeordnet ist. Durch die so 
ermittelten Eigenvektoren erhalt man im Ergebnis einen Mix von Suchanfragen, 
die in der jeweiligen Kombination mit besonders hoher Wahrscheinlichkeit in jung- 
ster Vergangenheit vorgekommen sind. 

Mit den so ausgewahlten, vergleichsweise grolien Eigenwerten der Korrelations- 
matrix zugeordneten ..Eigenanfragen" greift das Analysemodul 20 in der Art einer 
Testanfrage auf den Index 8 zu und ermittelt so fur jede „Eigenanfrage" die zu die- 
ser Eigenanfrage als relevant erkannten Datensatze oder Domains 4. Da die sol- 
chermaden ermittelten Domains 4 in besonderem Mafie dem aktuellen Benutzer- 
interesse entsprechen, werden fur diese Domains 4 die Systemressourcen bei der 
erneuten Durchsuchung des World-Wide-Web im Vergleich zum vorigen Durch- 
lauf proportional erhoht. Dies kann beispielsweise durch eine Zuwelsung eines 
Wichtungsfaktors bei der Bereitstellung der Systemressourcen fur die jeweilige 
Domain 4 nach der Beziehung 

WA) = (l + a*A£)a,/?>0 

erfolgen, wobei X k der Eigenwert der zugehorigen Eigenanfrage D k eine auf diese 
Eigenanfrage als Treffer angezeigte Domain 4 und a eine geeignet gewahlte Kon- 
stante >0 sein kann. 
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Zusammenfassung 

Ein Verfahren zur Erstellung von fQr Datensatze (4) aus einer Datenbank, insbe- 
sondere aus dem World-Wide-Web, charakteristischen Kurzdatensatzen (10) zur 
Hinterlegung auf einem Speichermodul (6) als Basis zur Ermittlung der fur eine 
vorgebbare Suchanfrage relevanten Datensatze (4) soli zur Erzeugung eines fur 
eine qualitativ hochwertige Informationsbeschaffung aus der Datenbank oder aus 
dem World-Wide-Web besonders geeigneter Suchindex geeignet sein. Dazu wer- 
den erfindungsgemaft die zur Erstellung eines Kurzdatensatzes (10) aus einem 
Datensatz (4) bereitgestellten Systemressourcen unter Beriicksichtigung von er- 
mittelten Erfahrungswerten aus vorangegangenen Suchanfragen gewahlt. 

Figur 
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AnsprQche 

1 . Verfahren zur Erstellung von fur Datensatze (4) aus einer Datenbank, insbe- 
sondere aus dem World-Wide-Web, charakteristischen Kurzdatensatzen 
(10) zur Hinterlegung auf einem Speichermodul (6) als Basis zur Ermittlung 
derfQr eine vorgebbare Suchanfrage relevanten Datensatze (4), bei dem die 
zur Erstellung eines Kurzdatensatzes (10) aus einem Datensatz (4) bereitge- 
stellten Systemressourcen unter BerQcksichtigung von ermittelten Erfah- 
rungswerten aus vorangegangenen Suchanfragen gewahlt werden. 

2. Verfahren nach Anspruch 1, bei dem die Erfahrungswerte eine fur die Anzahl 
gleichartiger Suchanfragen in einem vorgebbaren Zeitintervall charakteristi- 
sche Kennzahl umfassen. 

3. Verfahren nach Anspruch 1 oder 2, bei dem als Systemressourcen die Res- 
sourcen eines zur Erstellung der fur die Datensatze (4) jeweils charakteristi- 
schen Kurzdatensatze (10) vorgesehenen Durchsuchermoduls (16) unter 
BerQcksichtigung von ermittelten Erfahrungswerten aus vorangegangenen 
Suchanfragen gewahlt werden. 

4. Verfahren nach einem der AnsprQche 1 bis 3, bei dem bei der Ermittlung der 
Erfahrungswerte Korrelationen zwischen Einzelelementen der Suchanfragen . 
berQcksichtigt werden. 

5. Verfahren nach einem der AnsprQche 1 bis 4, bei dem bei der Ermittlung der 
Erfahrungswerte die relative Haufigkeit von Suchanfragen und/oder von Ein- 
zelelementen der Suchanfragen berQcksichtigt wird. 
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6. Verfahren nach Anspruch 5, bei dem denjenigen Datensatzen (4), die fur ei- 
ne vorgegebene Suchanfrage oder fQr eine vorgegebene Kombination aus 
Einzelelementen von Suchanfragen als relevant erkannt werden, proportio- 
nal zur relativen Haufigkeit der Suchanfrage bzw. der Kombination aus Ein- 
zelelementen von Suchanfragen zusatzliche Systemressourcen fur die Er- 
stellung des zugeordneten Kurzdatensatzes (10)zugewiesen werden. 

7. Verfahren zur Ermittlung von fQr eine vorgebbare Suchanfrage relevanten 
Datensatzen (4) aus einer Datenbank, insbesondere aus dem World-Wide- 
Web, bei dem in einem Speichermodul (6) hinterlegte, fiir die Datensatze (4) 
charakteristische, nach dem Verfahren nach einem der AnsprOche 1 bis 6 er- 
stelite Kurzdatensatze (10) auf ihre Relevanz fur die jeweilige Suchanfrage 
hin durchsucht werden. 

8. Suchsystem (1 ) zur Ermittlung von fQr eine vorgebbare Suchanfrage relevan- 
ten Datensatzen (4) aus einer Datenbank, insbesondere aus dem World- 
Wide-Web, insbesondere zur DurchfQhrung des Verfahrens nach Anspruch 
7, bei dem in einem Speichermodul (6) fQr die Datensatze charakteristische 
Kurzdatensatze (10) hinterlegt sind, wobei die zur Erstellung eines Kurzda- 
tensatzes (10) aus einerri Datensatz (4) bereitgestellten Systemressourcen 
unter BerQcksichtigung von hinterlegten Erfahrungswerten aus vorangegan- 
genen Suchanfragen gewahlt sind. 

9. Suchsystem (1 ) nach Anspruch 8, bei dem die Erfahrungswerte eine fQr die 
Anzahl gleichartiger Suchanfragen in einem vorgebbaren Zeitintervall cha- 
rakteristische Kennzahl umfassen. 

10. Suchsystem (1) nach Anspruch 8 oder 9, bei dem als Systemressourcen die 
Ressourcen eines zur Erstellung der fQr die Datensatze (4) jeweils charakte- 
ristischen Kurzdatensatze (10) vorgesehenen Durchsuchermoduls (16) unter 
BerQcksichtigung von hinterlegten Erfahrungswerten aus vorangegangenen 
Suchanfragen gewahlt sind. 
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